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Über die Länge nicht-trivialer Collatz-Zyklen 


von Christian Hercher, Flensburg 


Dieser Artikel ist das Ergebnis eines etwa einjährigen Projekts, welches sich aus ei¬ 
ner Diskussion auf dem Forum Matheplanet ergeben hat, siehe ]2f. Ich danke dabei 
allen Mitdiskutanten, die immer wieder neue Ideen ein- und damit das Vorhaben vor¬ 
angebracht haben. Insbesondere möchte ich dabei Gerhard Pracht und den Autor 
„Amateur" nennen. 

Beim Collatz-Problem stellt sich die Frage, ob für jede Startzahl k > 0 die 
zugehörige Collatz-Folge Ck irgendwann in den trivialen Zyklus 1,4,2,... 
übergeht. Diese Frage ist bisher unbeantwortet. In dieser Arbeit untersuchen 
wir die Mindestlänge eines hypothetischen nicht-trivialen Zyklus und zeigen 
folgende Ergebnisse: 

1. Ein nicht-trivialer Collatz-Zyklus muss mindestens 17 Milliarden ver¬ 
schiedene Folgeglieder beinhalten. (Zuvor bestes bekanntes Ergebnis war 
ein Wert leicht unterhalb von 1,03 Milliarden Folgegliedern, siehe |T] in 
Verbindung mit [5].) 

2. Für alle Startzahlen k < 87 • 2 60 , also insbesondere alle k < IO 20 , geht 
die jeweilige Collatz-Folge in den trivialen Zyklus über. (Zuvor beste 
bekannte obere Schranke für diese Aussage war 5 • 2 60 , siehe [5] (0.) 

Dabei kamen neben hohem Rechnereinsatz und den algorithmischen und 
mathematischen Methoden von bisherigen Autoren auf diesem Gebiet wie 
Leavens und Vermeulen |3| sowie Oliveira e Silva 00 auch neue Ideen zum 
Einsatz. 

1 Collatz-Folgen und erste Abschätzungen zu nicht¬ 
trivialen Zyklen 

Wir definieren den Collatz-Operator C : N —> N via 



§ , für gerade n, 

3n + 1, für ungerade n, 


n i —> 


der damit für jedes Folgeglied einer Collatz-Folge dessen Nachfolger be¬ 
rechnet. Unter dem trivialen Zyklus verstehen wir die Teilfolge 1,4,2, da 
C(l) = 4, C(4) = 2 und schließlich wieder C(2) = 1 ist. Ist eine Collatz- 
Folge einmal bei diesem Zyklus angelangt, durchläuft sie diesen also peri¬ 
odisch und erzeugt dabei keine neuen Folgeglieder mehr. 

Die Collatz-Vermutung besagt nun, dass für jede Startzahl k > 0 die zuge¬ 
hörige Collatz-Folge Ck irgendwann in den trivialen Zyklus übergeht. Diese 
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Vermutung ist bisher unbewiesen. Wäre sie falsclf] müsste mindestens eine 
der beiden folgenden Aussagen eintreten: 


o Für eine Startzahl k divergiert die zugehörige Collatz-Folge Ck unbe¬ 
schränkt. 

o Für eine Startzahl k geht die zugehörige Collatz-Folge in einen vom 
trivialen Zyklus verschiedenen Zyklus über. (Dieser heißt dann nicht¬ 
trivial.) 


Wir widmen uns hier dem zweiten Punkt und fragen uns, welche Eigenschaf¬ 
ten ein solcher nicht-trivialer Zyklus haben müsste, so er existiert. 

Sei 17 die Menge aller Folgeglieder in einem solchen nicht-trivialen Zyklus 
sowie fl g und Ll u die Mengen der geraden bzw. ungeraden Folgeglieder in Q. 
Zur einfacheren Bezeichnung seien auchp := |f2 g | und q := |0 U | als Anzahlen 
der geraden bzw. ungeraden Folgeglieder in diesem Zyklus eingeführt. Dann 
ist 


i n =n c( ^> = n ■ n c w = n f ■ n ( 3n+ o 


n£f2 


n£Qcr nGfi u 




n MV n (»dl 




nGO u 


nG^u 


also 


2, = n p+A- 


n£fl u 


Dies kann man nun weiter abschätzen. Einerseits ist offensichtlich die rechte 
Seite Jlnen (3 + ^) größer als IlnG^ 3 = 3 q . Umgekehrt ist sie aber auf¬ 
grund der Ungleichung zwischen arithmetischem und geometrischem Mittel 

1 Obwohl es einige, gute heuristische Argumente gibt, an deren Richtigkeit zu glauben: 
Fasst man etwa den (3n+l)-Schritt mit der darauf zwingend folgenden Halbierung zusam¬ 
men, so kann man dies für genügend große Folgeglieder x als < abschätzen. Mit dem 
heuristischen Ansatz, dass dadurch mit gleicher Wahrscheinlichkeit gerade bzw. ungerade 
Folgeglieder erhalten werden, kann man dann abschätzen, dass der Erwartungswert des 

Faktors von einem Folgeglied zum nächsten \J\' \ < 1 ist. Damit fällt die Folge im 
Erwartungswert immer weiter (bis zum Erreichen der Schranke, unter der die gemach¬ 
te Abschätzung für den (3n+l)-Schritt nicht mehr gilt) und man erwartet eine von der 
Startzahl k logarithmisch abhängende Anzahl an Folgegliedern, bevor die Folge mit ge¬ 
gen 1 gehender Wahrscheinlichkeit in den trivialen Zyklus eintritt, vgl. auch den Artikel 
Einige Hilfsmittel für das (3n+l )-Problem von Ingo Althöfer aus \/WURZEL 5/2018. 
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auch höchstens so groß wie 



mit H := q ' Snen n • Zusammen erhalten wir also die Ungleichungskette 

3 9 < 2 p < (3 + p) q 

bzw. nach Logarithmieren zur Basis 2 

q ■ log 2 (3) <p<q■ log 2 (3 + ii) 
und nach Teilen durch q also 

log 2 (3) < ^ < log 2 (3 + jj). 


Demnach muss die rationale Zahl £ „in der Nähe“ der irrationalen Zahl 
log 2 (3) liegen, und zwar umso näher, je kleiner das durchschnittliche Rezi¬ 
proke p eines ungeraden Folgeglieds im nicht-trivialen Zyklus ist. 

Aus der Zahlentheorie ist bekannt, dass man die besten rationalen Approxi¬ 
mationen einer irrationalen Zahl a aus deren Kettenbruchentwicklung erhält. 
Anders formuliert: Weiß man, dass eine rationale Zahl | näher an a liegt 
als ein endliches Anfangsstück ^ der Kettenbruchentwicklung von a mit 
teilerfremden p n und q n , so muss q > q n (und damit dann auch p > p n ) 
gelten. 

Wenn wir also für ein solches Anfangsstück ^ der Kettenbruchentwicklung 
von log 2 (3) nachweisen können, dass log 2 (3 + p) < ^ ist, so gilt 

log 2 (3) < - < log 2 (3 + p) < — 

<1 Qn 


und damit besteht dieser Zyklus aus mindestens p+q > p n +q n Folgegliedern. 
Wir werden im Folgenden zeigen, dass für alle nicht-trivialen Collatz-Zyklen 
gilt, dass 


log 2 (3 + ß) < — 

<721 


10 439 860 591 
6 586 818 670 
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mit dem 21. Kettenbruch ^ von log 2 (3) ist, woraus dann sofort folgt, dass 
dieser Zyklus aus mehr als P 21 + 921 , also insbesondere mehr als 17 Milliarden 
Folgegliedern bestehen muss. Um dies zu zeigen, ist also eine genügend ge¬ 
naue Abschätzung von /j vonnöten. Genauer: Es muss /r < 2 izuo 20 gezeigt 
werden. 

Weiß man, dass jede Collatz-Folge mit einer Startzahl k < S in den trivialen 
Zyklus übergeht, so muss jedes Folgeglied eines nicht-trivialen Zyklus, also 
auch jedes Element von fl u , größer sein als S. Dementsprechend gilt dann 
die einfache Abschätzung 



Jedoch war bisher nur die beste Schranke 5 a it = 5 • 2 60 w 5,76 • 10 18 be¬ 
kannt, welche um einen Faktor 37 zu klein für den gewünschten Satz ist. 
Damit konnte nur die entsprechende Aussage für das 19. Anfangsstück der 
Kettenbruchentwicklung von log 2 (3) gezeigt werden, was dann zu dem vor¬ 
genannten Ergebnis von mindestens einer Milliarde Folgegliedern führte. 
Um Rechenaufwand zu sparen, wurden für den hier zu zeigenden Satz die 
folgenden beiden Teilaussagen bewiesen, die dann zusammen den gewünsch¬ 
ten Sachverhalt liefern: 

1. Alle Collatz-Folgen mit Startzahlen S^eu < 87-2 60 ss 1,003TO 20 gelangen 
in den trivialen Zyklus. 

2. Ist die erste Teilaussage wahr, so gilt für jeden nicht-trivialen Zyklus 

^ < 2,17- io 20 ■ 

Man bemerke, dass fi deutlich kleiner als ist bzw. umgekehrt S neu nur 
knapp halb so groß, wie es sein müsste, um mit der naiven Abschätzung von 
/i die gewünschte Schranke zu unterschreiten. Nur durch einen neuen An¬ 
satz sowie einige weitere algorithmische Verbesserungen konnte das Projekt 
mit den verfügbaren Ressourcen in akzeptabler Zeit bewältigt werden. Wie 
die beiden Teilaufgaben angegangen wurden, soll im Folgenden vorgestellt 
werden. 

2 Algorithmische und Mathematische Überlegungen 

Zuerst wollen wir uns der Frage widmen, wie man möglichst effizient für 
alle Startzahlen unterhalb einer gewissen Schranke nachweisen kann, dass 
die zugehörigen Collatz-Folgen in den trivialen Zyklus übergehen. 
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2.1 Effiziente Berechnung von Collatz-Folgen 

Als erstes fällt vielleicht auf, dass nach einem ungeraden Folgeglied n direkt 
ein gerades 3n + 1 folgt, was danach sofort halbiert wird. Also kann man 
den ,,(3n+l)-Schritt“ und den nachfolgenden Halbierungs-Schritt zu einem 
, 2 +l -Schritt“ zusammenfassen. Auf diese Weise wird in jedem Schritt für 
gerade n die Halbierung ^ und für ungerade n der 3n 2 +l -Schritt durchgeführt. 
Im Folgenden wollen wir nur noch über diese beiden Arten von Schritten 
sprechen. Dies ist möglich, da uns ja nicht die Anzahl der Schritte bis zum 
Eintritt in den trivialen Zyklus interessiert, sondern nur, dass die betrachtete 
Collatz-Folge in endlich vielen Schritten in diesen gelangt. 

Die Restklasse modulo 2 gibt demnach an, welcher von beiden Schritten als 
nächstes folgt: 2m K»• m und 2m+ 1 i —> 3m+ 2. Danach sind in beiden Fällen 
wieder beide Restklassen möglich, d.h., die Information wurde vollständig 
ausgeschöpft. Kennt man jedoch von einem Folgeglied die Restklasse modulo 
2, so steht auch die Restklasse modulo 2 des Folgeglieds nach dem nächsten 
Schritt fest und damit auch die Art des übernächsten Schritts. Generell gilt, 
dass man aus der Kenntnis der letzten i Bits eines Folgeglieds, d. h. dessen 
Restklasse modulo 2 e , die Art der nächsten t Schritte bestimmen kann. Oder 
anders formuliert: Jedes Folgeglied a-2 e + b geht über in +g{b), wobei 

die beiden Funktionen / und g nur von der Restklasse b der betrachteten 
Zahl modulo 2 l abhängen. 

Dies hat gleich mehrfache Auswirkungen. Zum einen kann man diesen Fakt 
nutzen und die Berechnung dadurch beschleunigen, dass man gleich mehre¬ 
re Einzelschritte zu einem Mehrfachschritt zusammenfasst. Dazu berechne 
man zuvor für alle möglichen Restklassen b (mod 2^) die entsprechenden 
Werte f(b) und g(b) und tabelliere diese. Während der eigentlichen Berech¬ 
nung einer Collatz-Folge muss man dann nur die Restklasse des betrachteten 
Folgeglieds modulo 2 l bestimmen (was sehr effizient geht, da dies genau die 
letzten l Bits des Folgeglieds in seiner vom Computer nativ verwendeten 
Binärdarstellung sind) und kann dann in einer Rechnung daraus direkt den 
Wert des Folgeglieds dieser Collatz-Folge bestimmen, welcher t Schritte spä¬ 
ter erscheint. Dies wird im verwendeten Programm mit i — 10 getan, wobei 
dieser Wert so gewählt ist, dass alle notwendigen Tabellen noch im L2-Cache 
des Prozessors zwischengespeichert werden können, also direkt der CPU oh¬ 
ne lange Ladezeiten zur Verfügung stehen. 

Zum anderen kann diese Beobachtung aber auch genutzt werden, um direkt 
ganze Restklassen von Startzahlen gemeinsam zu betrachten und große An¬ 
zahlen davon direkt auszuschließen: Dazu stelle man zuerst fest, dass es 
genügt, für jede Startzahl k > 1 nachzuweisen, dass die zugehörige Collatz- 
Folge Ck irgendwann ein Folgeglied m < k enthält. Denn ab dann schließen 
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sich dort die Glieder der Collatz-Folge C m an, für welche nach dem Indukti¬ 
onsgedanken schon als gezeigt gelten kann, dass sie in den trivialen Zyklus 
mündet. Hat man also für alle Startzahlen 1 < k < S gezeigt, dass die je¬ 
weilige Collatz-Folge irgendwann einen Wert < k annimmt, ist für all diese 
Startzahlen damit gezeigt, dass die Collatz-Folgen in den trivialen Zyklus 
übergehen. 

Die Erkenntnis, dass man aus der Restklasse der Startzahl modulo 2 t di¬ 
rekt den Wert nach l Schritten berechnen kann, führt dazu, dass man z. B. 
auch direkt für alle Startzahlen einer bestimmten Restklasse feststellen kann, 
dass dieser neue Wert kleiner sein muss als die Startzahl, man diese also gar 
nicht mehr weiter betrachten muss. So geht etwa jede Startzahl der Form 
a ■ 2 1 + 0 nach einem Schritt über in a ■ 3° + 0 < a ■ 2 1 + 0, muss also nach 
dem Induktionsgedanken nicht weiter betrachtet werden. Von den ungera¬ 
den Startzahlen fallen aber auch z. B. direkt die der Form a ■ 2 2 + 1 heraus, 
da sie in zwei Schritten in a ■ 3 1 + 1 übergehen, was für a > 0 echt kleiner 
als die Startzahl ist. 

So kann man sukzessive Restklassen modulo immer größerer Zweierpoten¬ 
zen anschauen: Gelangt eine Restklasse modulo 2 e in den ersten £ Schritten 
zu einem Wert kleiner der Startzahl, kann man abbrechen. Wenn nicht, be¬ 
trachtet man die zwei Restklassen modulo 2 t+1 , in die sich die betrachtete 
aufspaltet, und überprüft jeweils, ob diese im (fM-l)-ten Schritt auf einen 
Wert kleiner der Startzahl führen. Diesen Prozess des Siebens von Restklas¬ 
sen führt man bis zur am Anfang vorgegebenen Maximaltiefe durch. Von 
den übrig bleibenden Restklassen sind dann alle Startzahlen < S zu erzeu¬ 
gen und einzeln zu betrachten. 

Dieser Sieb-Prozess verkleinert den Suchraum deutlich. So gibt etwa Oliveira 
e Silva in [3] an, dass von den etwas über 4 Milliarden Restklassen modu¬ 
lo 2 32 nur ca. 41 Millionen nicht ausgesiebt werden. Dies entspricht einer 
Quote von ca. einem Prozent. Wir bemerken, dass durch dieses Vorgehen 
die Startzahlen in der Gesamtberechnung nicht in aufsteigender Reihenfol¬ 
ge bis S erzeugt werden. Dass eine Collatz-Folge Ck in den trivialen Zyklus 
übergeht, ist damit erst dann bewiesen, wenn die Betrachtung für alle Rest¬ 
klassen vollständig ist. 

In der letzten Überlegung haben wir aus den Eigenschaften einer Zahl auf 
ihre Collatz-Nachfolger geschlossen. Man kann dies aber auch umgekehrt 
tun und die Collatz-Vorgänger betrachten. Auch hier gilt: Besitzt für eine 
Startzahl k ein Folgeglied n der zugehörige Collatz-Folge Ck einen „Collatz- 
Vorgänger“ m < k, d. h., auf m folgt in endlich vielen Schritten n, so kann 
auch hier die Berechnung abgebrochen werden, denn die Collatz-Folgen Ck 
und C m sind ab dem Folgeglied n identisch. Also geht Ck genau dann in 
den trivialen Zyklus über, wenn dies C m auch schon getan hat. Dies trifft 
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etwa auf alle Startzahlen der Form k = a ■ 2 6 + 15 zu. Zwar erhält man 
aus diesen in sechs Schritten die größeren Werte n = a ■ 3 4 + 20. Da aber 
auch die Startzahlen der Form m = a ■ 2 5 + 7 < k in fünf Schritten zum 
gleichen Wert n gelangen, muss nur C m weiter überprüft werden, während 
die weitere Berechnung von Ck nach dieser Feststellung abgebrochen werden 
kann. 

Diese Untersuchung auf mögliche kleinere Collatz-Vorgänger wurde nach 
Wissen des Autors hier erstmals in dieser intensiven Form betrieben. Sie 
führt zu einer weiteren deutlichen Suchraum-Einschränkung, etwa bei einer 
Siebtiefe von 32 Bit auf nur noch ca. 24 Millionen verbliebene Restklassen, 
was einer Verbesserung um den Faktor 1,7 gegenüber der reinen „Vorwärts¬ 
suche“ entspricht. Bei höheren Siebtiefen verstärkt sich der Einfluss weiter. 
Im für diese Suche geschriebenen und verwendeten Programm wird zuerst 
bis zur Tiefe von 32 Bit gesiebt. Diese Restklassen dienen dann zur Vertei¬ 
lung der Berechnung über verschiedene Prozesse auf einem PC sowie global 
über viele verschiedene Computer. Jede einzelne dieser Restklassen modulo 
2 32 wird weiter bis zur Tiefe von 58 Bit gesiebt, also in Restklassen modulo 
2 58 zerlegt. Von diesen (bezogen auf alle 2 58 ) wurden im Schnitt nur ca. ein 
Promille nicht ausgesiebt, d.h., es mussten dann alle Startzahlen < S in 
dieser Restklasse gebildet und einzeln betrachtet werden. Für jede einzel¬ 
ne dieser Startzahlen werden nun die oben aufgeführten Mehrfachschritte 
durchgeführt, bis ein Folgeglied kleiner der Startzahl (oder eine maximale 
Schrittzahl) erreicht wurde. (Das Maximum an Schritten wurde aber nie er¬ 
reicht, sodass alle Collatz-Folgen mit Startzahl < S in den trivialen Zyklus 
münden.) 

Da die Folgeglieder sehr schnell den Zahlenbereich bis 2 64 , welcher mit mo¬ 
derner 64-Bit-Prozessor-Architektur sehr effizient zu bearbeiten ist, verlas¬ 
sen, müsste eigentlich mit höherer Präzision, etwa 128-Bit-Arithmetik, ge¬ 
rechnet werden. Dies ist durch den verwendeten Compiler gcc auch durch¬ 
aus möglich, da dieser über den Standard hinaus auch 128-Bit-Ganzzahl- 
Datentypen zur Verfügung stellt. Jedoch sind diese nur Soft- und nicht 
Hardware-seitig implementiert, haben also deutliche Performance-Nachteile 
gegenüber 64-Bit-Operationen. 

Um diesen Flaschenhals zu umgehen, sollte die Anzahl an notwendigen 128- 
Bit-Operationen möglichst stark minimiert werden. Dies gelingt dadurch, 
dass für die Durchführung der nächsten 60 Einzelschritte (also 6 Mehrfach¬ 
schritte, da je 10 Einzel- zu einem Mehrfachschritt zusammengefasst wur¬ 
den) nur die Kenntnis der letzten 60 Bit eines Folgeglieds von Nöten ist. All 
diese Operationen können also modulo 2 64 durchgeführt werden, was sehr 
effizient möglich ist. Das garantiert, dass die Art der nächsten 60 Schrit¬ 
te (ob Halbierung oder „ 3n + 1 “) korrekt berechnet wird, nicht aber, wie 
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die davor liegenden höherwertigen Bits korrekt lauten. Insbesondere erhält 
man also auf diese Weise keine Aussage über die Größe der jeweils aktuell 
betrachteten Folgeglieder. Dem jedoch kann man beikommen, indem man 
parallel diese Folgeglieder auch näherungsweise durch Gleitkomma-Werte 
darstellt: Aus der Ganzzahlberechnung mit den letzten Bits wird die Art 
der nächsten Schritte klar, womit dann die Gleitkomma-Berechnung nähe¬ 
rungsweise durchgeführt und die Größe des jeweiligen Folgeglieds bestimmt 
werden kann. Ist dieser Näherungswert kleiner als ein bestimmter Schwellen¬ 
wert unterhalb der Startzahl (der so gewählt wird, dass die betrachtete Zahl 
trotz möglicherweise auftretender Rundungsfehler während der Berechnung 
trotzdem beweisbar sicher kleiner ist als die Startzahl), kann die Berech¬ 
nung mit dem obigen Argument an dieser Stelle abgebrochen werden. Ist 
dies aber auch nach den 60 Einzelschritten noch nicht der Fall, muss die Be¬ 
rechnung mittels exakter Ganzzahl-Arithmetik wiederholt werden, sodass 
wieder die volle Information über das jeweilige Folgeglied für die nächsten 
Schritte vorliegt. Da dies aber nur in ca. 2% aller Fälle nötig wurde, er¬ 
gibt sich trotz des ggf. doppelten Aufwands in diesen Fällen insgesamt eine 
deutliche Zeitersparnis. Auch dieser Ansatz scheint erstmals im vorliegenden 
Projekt intensiver verfolgt worden zu sein. 

Auch weitere Optimierungen auf eher niedrigem Abstraktionslevel (wie die 
Feststellung, dass Multiplikation oder Division mit/durch Zweierpotenzen 
effizienter durch einen Links- bzw. Rechts-Shift der Bits durchgeführt wer¬ 
den, oder man ggf. Schleifen mit fester Länge abrollt, um mögliche Verzwei¬ 
gungen, ob der Laufindex schon seine obere Schranke erreicht hat, zu vermei¬ 
den und so Instruktionen zu sparen) fanden Eingang in das C-Programm, 
welches Schritt für Schritt weiter optimiert wurde. Auf diese Einzelheiten 
soll hier aber nicht weiter eingegangen werden. 

Schlussendlich wurde das Programm am 14. August 2017 dem Distributed- 
Computing-Projekt yoyo@home des Rechenkraft e.V. hinzugefügt [5], so¬ 
dass sich über das Internet insgesamt über 1000 Freiwillige an den Berech¬ 
nungen beteiligen konnten. In einer Zeit von 40 Tagen wurden schließlich 
etwa 2,5 • 10 19 Rechenoperationen durchgeführt[^J was etwa 33 Jahren Re¬ 
chenzeit auf einem Prozessor-Kern eines gängigen Biiro-PCs entspricht. Da¬ 
bei wurde jede Aufgabe von zwei unterschiedlichen Rechnern ausgeführt 
und zum Vergleich validiert, um zufällige Berechnungsfehler ausschließen 
zu können. (Zum Vergleich: Oliveira e Silva benötigte ca. 40 CPU-Jahre 
zur Berechnung und weitere 40 zur Validierung seiner Ergebnisse aus dem 
Jahr 2008, welche einen ca. 17 mal kleineren Suchraum betrachtete. Dabei 

2 Das heißt, im Schnitt wurde für jede Startzahl bis 10 20 nur eine Viertel- 
Rechenoperation benötigt um nachzuweisen, dass die jeweilige Collatz-Folge in den tri¬ 
vialen Zyklus mündet. 
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ist festzustellen, dass sich die Rechenleistung der einzelnen CPU-Kerne in 
den letzten 10 Jahren kaum noch gesteigert hat, sondern die höhere Re¬ 
chenleistung seitdem insbesondere durch eine höhere Anzahl an Kernen je 
CPU erreicht werden konnte. Der weitaus größte Teil der Verringerung der 
benötigten Rechenzeit geht auf die algorithmischen Verbesserungen sowie 
den standardmäßigen Einsatz einer 64-Bit-Architektur, die sich damals erst 
etabliert hatte, zurück.) 

Neben der Erkenntnis, dass alle Collatz-Folgen mit Startzahlen < 87 • 2 60 in 
den trivialen Zyklus übergehen, was den bisherigen Maximalwert um den 
Faktor 17,4 übertrifft, konnten durch den erfolgreichen Abschluss des Pro¬ 
jekts insgesamt vier neue Pfad-Rekorde ermittelt werden, d. h. Startzahlen 
k, deren maximales Element in ihrer Collatz-Folge Ck größer ist als das 
aller Collatz-Folgen mit Startzahlen < k, siehe dazu [B]. Darüber hinaus 
konnte en passent auch eine weitere Schranke verbessert werden: Fasst man 
wie in der bisherigen Betrachtung einen ,,(3n+l)-Schritt“ mit dem darauf 
zwingend folgenden Halbierungs-Schritt zusammen, so kann man, beginnt 
man einen nicht-trivialen Zyklus o. B. d. A. beim kleinsten Folgeglied, diesen 
in aufeinanderfolgende Abschnitte von wechselseitig streng monoton stei¬ 
genden bzw. fallenden Teilfolgen unterteilen. (Das müssen dann natürlich 
gleich viele jeder Sorte sein.) Mit der hier neu gezeigten oberen Schranke 
S « 1,003T0 20 , für die alle Collatz-Folgen mit Startzahl < S in den trivialen 
Zyklus münden, konnte die Anzahl der mindestens in einem nicht-trivialen 
Zyklus vorkommenden streng monoton steigenden (und analog fallenden) 
Abschnitte von 75 auf 77 erhöht werden, siehe dazu [7]. (Die Autoren von 
[2 zeigen 2005 eine Schranke von mindestens 68 solcher Abschnitte, halten 
aber eine Verbesserung der Abschätzung auf 77 für quasi unmöglich, da sie 
diese erst für das Jahr 2419 prognostizieren. Zum Glück hat es seitdem ei¬ 
nige deutliche Weiterentwicklungen sowohl in der Hardware wie auch den 
Algorithmen in der Software gegeben, sodass deutlich bessere Ergebnisse 
mittlerweile möglich sind.) 

2.2 Abschätzungs-Verbesserung zu p 

Wir erinnern uns, dass p = | • X^nen n die Größe des durchschnittlichen 
Reziproken - der ungeraden Folgeglieder n eines nicht-trivialen Zyklus ist, 
dass wir p < 2 17 1 102 o = : s zeigen wollen und dafür voraussetzen dürfen, 
dass alle Collatz-Folgen mit Startzahl < S = 87 • 2 60 « 1,003 • IO 20 in den 
trivialen Zyklus münden, dies also auch der Fall ist für alle Collatz-Folgen, 
die mindestens ein Folgeglied < S besitzen. 

Die Idee ist nun, dass wir den nicht-trivialen Zyklus so in Abschnitte in 
der Folge unterteilen, dass wir für jeden dieser Abschnitte zeigen können, 
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dass der Durchschnitt der Reziproken der darin enthaltenen ungeraden Fol¬ 
geglieder kleiner als s ist. Denn gilt dies für alle Abschnitte des Zyklus, so 
natürlich auch für den gesamten Zyklus. 

Wir können o. B. d. A. annehmen, dass jeder dieser Abschnitte mit einem un¬ 
geraden Folgeglied anfängt. (Für Abschnitte ohne ungerades Folgeglied gilt 
die Aussage natürlich sofort auch.) Die einzelnen Abschnitte können dabei 
eine variable Länge kleiner oder gleich einem vorgegebenen Maximalwert 
besitzen. 

Ist das erste Folgeglied n eines solchen Abschnitts z. B. kongruent 5 (mod 8), 
also n = 8k + 5, so lautet das nächste Folgeglied 3n 2 t ~ 1 = 12 k + 8, was dann 
nach zwei weiteren Halbierungen auf 3/c + 2 führt. Da also auch 3A: + 2 
Teil des Zyklus ist und damit 3k + 2 > S > 1,003 ■ IO 20 gilt, ist demnach 
n = 8fc + 5 > | ■ IO 20 > i. Bricht man also den Abschnitt schon nach n 
ab, so gilt für diesen, dass das durchschnittliche Reziproke eines ungeraden 
Folgeglieds in diesem Abschnitt genau - und damit kleiner als s ist, was wir 
hier zeigen wollten. Der nächste Abschnitt startet dann mit dem nächsten 
ungeraden Folgeglied. 

Auf diese Weise wollen wir für die ersten Folgeglieder der Abschnitte ei¬ 
ne vollständige Fallunterscheidung nach ihren Restklassen modulo Zweier¬ 
potenzen durchführen, wobei jede ungerade natürliche Zahl in eine dieser 
Restklassen fällt. In jedem Fall wird dabei folgen, dass, liegt das erste Folge¬ 
glied eines Abschnitts in der gerade betrachteten Restklasse, so folgt, dass 
das durchschnittliche Reziproke der ungeraden Folgeglieder in diesem Ab¬ 
schnitt kleiner als s ist. Den Fall, dass das erste Folgeglied eines Abschnitt 
kongruent 5 modulo 8 ist, haben wir im vorgenannten Beispiel betrachtet. 
Generell gehen wir hier ähnlich vor wie beim Sieben der Collatz-Folgen nach 
den Restklassen ihrer Startzahlen modulo aufsteigenden Zweierpotenzen im 
vorherigen Teil dieses Artikels: Wir betrachten für das erste Folgeglied eines 
Abschnitts eine Restklasse r (mod 2 C ). Dann kennen wir auch die £ nach¬ 
folgenden Folgeglieder. Können wir aufgrund der Größenabschätzungen nun 
schließen, dass es ein 1 < t < £+\ gibt, sodass das durchschnittliche Rezipro¬ 
ke der ungeraden Folgeglieder unter den ersten t hier betrachteten kleiner 
ist als s, so brechen wir den Abschnitt nach dem i-ten Folgeglied ab und ha¬ 
ben damit für diese Restklasse des ersten Folgeglieds dieses Abschnitts das 
Gewünschte gezeigt. (Der Abschnitt besteht dann aus t Folgegliedern.) An¬ 
dernfalls erhöhe man l um Eins und betrachte die beiden Teilfälle, dass das 
erste Folgeglied kongruent r (mod 2 t+l ) bzw. kongruent r + 2 t (mod 2 f - +1 ) 
ist. (Dies geschieht solange, bis entweder alle Fälle abgedeckt sind, oder aber 
eine maximale Zweierpotenz als Modul erreicht wurde. Im konkreten Fall 
wurden die Werte so gewählt, dass die Berechnung durch Abdeckung aller 
Teilfälle abgeschlossen werden konnte.) 


GWURZEL 






Über die Länge nicht-trivialer Collatz-Zyklen 


11 


Neben der Vorwärts-Betrachtung, welcher die Größe der nächsten Folge¬ 
glieder einbezieht, wurde auch wieder eine Rückwärts-Betrachtung durchge¬ 
führt: Kann man für ein erstes Folgeglied n bzw. einen seiner Nachfolger 
einen anderen Collatz-Vorgänger m < n finden, dann führt also auch die 
Collatz-Folge mit Startzahl m in den betrachteten nicht-trivialen Zyklus. 
Also muss auch schon m > S gelten. Das dazu im vorherigen Teil des Ar¬ 
tikels beschriebene Beispiel reicht aus, um damit die Abschnitte, die mit 
Folgegliedern der Form n = a ■ 64+15 beginnen, erfolgreich zu betrachten: 
Diese führen in sechs Schritten auf die Folgeglieder a • 84 + 20, die auch 
in fünf Schritten aus m = a ■ 32 + 7 < ^ folgen. Da damit auch m > S 
gelten muss, ist insbesondere n > 2S > 2 • IO 20 und das nächste ungerade 
Folgeglied 3ra 2 t ~ 1 > 3 • IO 20 . Brechen wir den Abschnitt nach diesen beiden 
Folgegliedern ab, ist also das durchschnittliche Reziproke eines ungeraden 
Folgeglieds in diesem Abschnitt kleiner als \ • (güW + 3 . ^ 20 ) = 2 4.1020 < 
wie gewünscht. 

Diese beiden Strategien führen dazu, dass bei der Betrachtung der noch nicht 
abgeschlossenen Restklassen modulo 2 f , in welchen sich das erste Folgeglied 
eines Abschnitts befinden kann, von dem noch nicht die gewünschte Eigen¬ 
schaft gezeigt werden konnte, für einige der Nachweis nun gelingt, während 
die übrigen jeweils zwei Unterfälle bei der Betrachtung modulo 2 f+1 erzeu¬ 
gen. Tatsächlich steigt die Anzahl der offenen Restklassen auf diese Weise 
exponentiell mit t an, wenn auch mit einer Basis deutlich kleiner Zwei. 
Jedoch wurde hierbei bisher das Zusammenspiel aus absoluter Größe und 
Restklasse des betrachten ersten Folgeglieds eines Abschnitts nicht weiter 
beachtet: In allen Fällen ging es um Vielfache dieses ersten Folgeglieds, von 
denen das kleinste dann nach unten durch S abgeschätzt wurde und so die 
gewünschte Aussage folgte. Tatsächlich wissen wir aber mehr: 

Gilt für ein erstes Folgeglied n eines Abschnitts, dass es kongruent r (mod 2 e ) 
mit 0 < r < 2 t ist, so wissen wir nicht nur, dass es (als Teil des nicht-trivialen 
Zyklus) größer als S ist. Wir wissen z. B. auch, dass n > r ist. Ist die Zwei¬ 
erpotenz, modulo der wir gerade die Betrachtung durchführen, schon groß, 
so kann auch die Restklasse r hier große Werte annehmen. Und ist r > 1 , 
so sind wir mit dieser Restklasse fertig, da - < - < s gilt, der betrachtete 
Abschnitt also nach einem Folgeglied abgebrochen werden kann und dann 
das Gewünschte erfüllt. 

Und sollte für dieses n = r (mod 2^) zwar nicht r > - gelten, sondern 
r < S = 87-2 60 « 1,003- IO 20 , so kann nicht n = r gelten, da wir ja wissen, 
dass es dann in den trivialen Zyklus führen würde. Also muss für diese 
Restklassen ein erstes Folgeglied eines Abschnitts mindestens den Wert r+2 e 
besitzen. Und dieser Wert ist für genügend große £ wiederum groß genug, 
um mittels der gerade zuvor durchgeführten Überlegung das Gewünschte 
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für diesen Abschnitt zu zeigen. 

Auch lassen sich diese Zusammenhänge nicht nur für das erste Folgeglied, 
sondern natürlich auch die weiteren, und deren Vorgänger anwenden. Zu¬ 
sammen führt dies dazu, dass die Zahl der noch offenen Restklassen bei 
diesen Betrachtungen bis £ = 60 exponentiell ansteigt, dann bis l = 70 
kaum noch wächst und schließlich wieder zu sinken beginnt. (Insbesondere 
kann ab £ = 68 die Zahl der noch offenen Restklassen gar nicht mehr stei¬ 
gen, da dann für eine noch offene Restklasse r (mod 2 e ) der zweite Unterfall 
r + 2 e (mod 2 e - +1 ) wegen 2 e > - automatisch erfüllt wird, also höchstens 
ein Unterfall mod 2 l+1 übrig bleibt.) 

Auf einem Server wurde in einer Zeit von einer Woche nun nachgeprüft, dass 
tatsächlich alle Restklassen sukzessive abgeschlossen werden können, also für 
jedes mögliche erste Folgeglied eines Abschnitts folgt, dass das durchschnitt¬ 
liche Reziproke dieses Abschnitts kleiner ist als der gewünschte Maximalwert 
s. Dabei wurde den Folgen eine Maximallänge von 250 Folgegliedern zuge¬ 
billigt (d. h. eine Untersuchung der Restklasse des ersten Folgeglieds eines 
Abschnitts bis maximal modulo der Zweierpotenz 2 250 ), wobei dies nie er¬ 
reicht wurde. Alle Abschnitte brechen nach weniger als 250 Folgegliedern 
ab. 

Da dies für alle Abschnitte gezeigt werden konnte, gilt auch für den gesam¬ 
ten Zyklus (bzw. auch mehrere Durchläufe davon hintereinander), dass das 
durchschnittliche Reziproke der ungeraden Folgeglieder darin kleiner ist als 
s, unter der Annahme, dass jede Collatz-Folge mit Startzahl < S = 87-2 60 « 
1,003 ■ IO 20 in den trivialen Zyklus iibergehtj^] 

Da wir aber diese Voraussetzung im vorherigen Teil dieses Artikels schon 
gezeigt haben, folgt mit den dort angegebenen weiteren Überlegungen der 

Satz. Ein nicht-trivialer Collatz-Zyklus besteht aus mehr als 17026 679261, 
also mehr als 17 Milliarden Folgegliedern. 
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